[Alteryx Designer:ツールのご紹介]結合ツールについて
初心者向けの認定試験Alteryx Designer Coreについてこちらをご覧ください。
はじめに
Alteryx Designer Coreの認定試験に必要なツールの紹介ブログです。今回は結合ツールについて詳しくご説明させていただきます。
参考ページ:
結合ツール(Join Tool)
このツールでは二つの入力データテーブルを結合することが出来ます。入力データで共通のフィールドやレコードの位置に基づいて結合します。共通のフィールドが最低限一つが必要で複数の共通のフィールドも同時に結合することも出来ます。
また、このツールでは出力フィールドの位置・データ型・データのサイズやフィルド名を変更することが出来ます。出力フィールドで説明追加によって好みなメモやコメントを加えることも出来ます。
入力データの「L」と「R」で結合対象に指定したフィールドのデータが一致する場合、「J」に出力されます。結合対象外の「R」入力データが出力の「R」に現れ、対象外の「L」入力データが出力の「L」に現れます。
ジョインする内容が大文字と小文字で別れており、例えば大文字のAが小文字のaと別物扱いになるためにジョインされません。Case Insensitive Joinを希望する際に大文字と小文字が同じくなるように前処理が必要です。
結合条件対象になるデータがデカルト積として結合されます。行を乗算され、列を添加されます。例えば左入力「L」入力が5行×6列と右入力「R」入力が3行×4列であれば出力データが15行×10列になります。
複数のフィールドを結合した際に各フィールドが連結され総合な文字列の探索になります。
● 結合するフィールドのデータ型に制限が以下の通りになります。
● 文字列フィールドは他の文字列フィールドにのみ結合できます。
● 数値フィールドは他の数値フィールドにのみ結合できます。
● ブール型フィールドは、他のブール型フィールドにのみ結合できます。
● DateTimeフィールドタイプは、その正確なタイプにのみ結合できます。
● 空間フィールドを結合できませんが、 空間マッチツール を代わりに使用します。
● Blobフィールドは、他のタイプに結合することはできません。
● 警告: 丸め誤差のため、Double または Float の結合は推奨されません。
ツールの設定
ツールの設定では二つの選択肢があります「レコードの位置による結合」と「特定のフィールドで結合」。「レコードの位置による結合」では結合する2つのテーブルのフィールド構造が同じで、データが2つのテーブル内の位置によって結合される場合は、このオプションを選択します。「特定のフィールドで結合」では2つのテーブルに共通の1つ以上のフィールド (ID など) があり、データが結合される場合は、このオプションを選択します。 複数のフィールドで結合することができます。 各結合は、グリッド内の別個の行にする必要があります。
ユースケース
レコードの位置による結合
特定のフィールドで結合
スタースキーマのデータベースではディメンション表とファクト表があり、これらのテーブルを結合する際に必ず主キーを把握し、主キーで結合するのが良いでしょう。以下の例により主キーで結合した際と二次キーで結合した際の違いを理解しましょう。
入力テーブルがこちら:
もしこれらの二次キーである”ID”で結合した場合は以下のように間違った結果が現れますので注意が必要です。
関係データベースが主キーでジョインするのが適切です。今回の例で主キーの”Sale ID”で結合したほうが以下のように正しい結果が現れます。
まとめ
ジョインツールがデータブレンドする際に重要な役割があります。関係データベースなどのテーブルを主キーで結合するのが一般的です。
Alteryxの導入なら、クラスメソッドにおまかせください
日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。